Integration fortgeschrittener Kompressionsalgorithmen durch den Neural Network Distiller von NervanaSystems
Assigned to F. Lorenz.
Bachelor’s Thesis
Abstract
Implementierung von Pruning, Quantisierung und Early-Exit um die Effizienz der Inferenz mit TC-Resnet8 zu steigern.